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摘要 : [目的 /意义 ] 构建 普 适 的 领域 本 体 模型 框架 和 规范 的 方法 体系 ,为 STKOS 实现 动态 
建 模 的 本 体 工具 集 和 面向 领域 应 用 的 本 体 网 络 提供 建设 依据 。[ 方 法 /过 程 ] 调研 分 析 不 同 
层次 的 领域 本 体 模型 ， 总 结 能 够 为 STKOS 本 体 建设 提供 的 参考 ， 构 建 STKOS 中 学 科 领 域 
本 体 模型 的 三 层 架 构 , 提出 各 层 框 架 可 遵循 的 方法 , 并 以 中 国 科学 院 植物 研究 所 的 需求 为 例 ， 
阐述 了 本 文 模 型 框架 在 构建 植物 多 样 性 领域 本 体 的 应 用 。 [结果 /结论 ] 按照 领域 本 体 模型 三 


层 架 构 所 构建 的 植物 多 样 ; 
程 高 效 、 所 支撑 应 用 场景 丰富 的 优点 ， 
提供 了 实用 框 染 ， 


Ps 


关键 词 : 领域 本 体 STKOS 模型 框架 
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1 引言 


生 领域 本 体 ， 较 之 其 他 领域 本 体 ， 具有 知识 组 织 体系 清晰 、 构 建 过 
因此 ， 该 研究 为 STKOS 快速 而 有 效 地 构建 领域 本 体 
未 来 可 应 用 于 知识 服务 平台 语义 层 的 建设 。 

植物 多 样 性 领域 


科技 文献 信息 的 知识 组 织 体系 〈Scientific & Technological Knowledge Organization 
Systems, STKOS) 建设 促进 了 科技 文献 信息 服务 向 知识 服务 的 转变 , 为 海量 科技 文献 资源 的 
整合 组 织 、 深 层 揭 示 和 知识 关联 提供 支撑 趾 。 领 域 本 体 作为 知识 组 织 体系 中 规范 描述 和 语义 
组 织 学 科 领 域 核心 知识 的 模型 ,通过 对 科技 文献 信息 资源 深层 知识 内 容 的 集成 ,挖掘 和 关联 ， 


能 够 支持 面向 科学 研究 的 学 科 化 服务 和 应 用 。 


日 于 在 构建 过 程 中 缺乏 统一 清晰 的 框架 和 规范 
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完善 的 依据 ， 目 前 已 有 领域 本 体 的 交互 和 集成 
的 本 体 资源 ,各 学 科 领 域 本 体 需 要 提供 


可 复 


效果 较 弱 ，STKOS 涉及 学 科 众多 ， 为 了 形成 


规范 化 的 构建 场景 和 步骤 依据 ， 因 此 ， 建 立 统 


一 的 领域 本 体 模型 框架 和 方法 体系 ,能够 为 STKOS 本 体 建设 实现 动态 建 模 的 本 体 工具 集 和 


面向 领域 应 用 的 本 体 网 络 提供 基础 。 


本 文 研究 了 可 供 各 学 科 参 考 的 领域 本 体 模型 框架 , 提出 学 科 领 域 本 体 在 构建 中 可 依据 的 


过 程 和 方法 ， 为 开发 领域 本 体 动态 建 模 的 本 体 工具 集 提供 场景 和 流程 依据 ， 实 现 STKOS 领 


域 本 体 网 络 的 构建 。 


体 应 用 。 
2 不 同 层次 领域 本 体 模型 分 析 


构建 领域 本 体 的 目标 就 是 要 捕获 相关 领域 的 知识 ， 


该 领域 内 共同 认可 的 术语 , 并 从 不 同 层次 的 


2.1 顶层 本 体 模 型 


顶层 本 体 是 适 于 所 有 学 科 领 域 的 概念 模式 , 为 各 学 科 构 建 领域 本 体 提供 可 重 | 


式 化 模式 上 给 出 这 些 术语 之 间 相 互 关系 的 明确 
定义 。 根据 概念 是 否 面向 学 科 领 域 及 其 描述 层次 , 目前 领域 本 体 主要 从 无 具体 学 科 特 征 的 顶 
层 本 体 〈Top Ontology)、 表 达 学 科 共 有 特征 的 领域 上 层 本 体 〈Top-domain Ontology)、 面 向 
有 具体 建设 目标 的 领域 应 用 本 体 (Domain Ontology) 方 


因此 ， 本 文 在 对 不 同 层次 领域 本 体 进 行 调研 的 基础 上 ， 提 出 学 科 领 域 本 
体 模型 的 三 层 架 构 , 并 以 植物 多 样 性 领域 为 例 , 阐述 了 本 文 模型 框架 在 构建 领域 本 体 中 的 具 


提供 对 该 领域 知识 的 共同 理解 , 确定 


D 


进行 研究 


| 的 普 适 框 


架 ， 易 于 适应 不 同 领域 需求 的 变化 ， 能 够 增强 各 学 科 领 域 本 体 之 间 的 互 操作 性 。 目 前 关于 顶 
层 本 体 构 建 的 研究 , 通过 直接 分 析 现 实 世 界 中 基本 的 类 和 关系 ,或 从 不 同 的 抽象 角度 建立 展 
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现 和 表示 现实 世界 的 事物 框架 ， 


组 织 和 描述 的 可 扩展 模型 。 


BFO 本 体 是 由 形式 化 本 体 和 医学 信息 科学 下 
Medical Information Science, IFOMIS) 构建 的 描述 现实 世界 存在 事物 的 基本 框架 ， 
过 对 现实 领域 中 类 和 关系 的 抽象 ,以 多 元 化 的 角度 展现 了 现实 世界 中 存在 的 实体 ,， 能够 为 不 
同 领域 本 体 的 构建 提供 通用 的 上 层 框架 。BFO 首 
现实 世界 存在 的 事物 分 成 两 类 ， 持 续 性 实体 和 过 程 、 


实体 ,， BEA AH 


而 存在 的 依赖 实体 ， 例 如 固有 特征 、 角 色 、 功 能 


为 物质 实体 之 间 的 部 分 整体 关系 、 
空间 的 位 置 关系 。 临时 性 实体 用 于 表达 持续 愧 
致 分 为 物质 实体 与 所 在 过 程 的 参与 关系 、 物质 实体 与 相关 时 间 范 围 的 存在 关系 ， 
地 点 的 事件 发 生 关 系 。BFO 本 体 框架 提供 了 对 ] 


tH 
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典型 本 体 模型 有 BFO (Basic Formal Ontology) 和 DOLCE 
(Descriptive Ontology for Linguistic and Cognitive Engineering), 为 不 同学 科 领 域 提 供 了 资源 


KE o 


先 依据 在 时 间 范 围 内 实体 存在 的 方式 ，) 
活动 等 临时 性 实体 中。 对 于 持续 存在 的 
hE 并 存在 的 物质 实体 以 及 空间 区 域 等 非 物质 实体 , 也 包括 需要 物质 实体 作为 载体 

BFO 框架 为 不 同 领域 知识 关系 的 构建 提 
供 了 上 层 关 系 体系 , 梳理 了 现实 世界 中 实体 之 间 的 基本 关系 。 对 于 持续 性 实体 类 体系 ， 主 要 


究 所 〈JInstitute for Formal Ontology and 


BFO 3H 


"à 


固有 特征 与 物质 实体 的 本 质 即 属 关系 、 物 质 实 体 与 所 处 地 
实体 的 时 间 信 息 ， 


两 大 类 实体 之 间 的 关系 大 
过 程 与 所 在 


岗 实 世界 抽象 的 基本 实体 概念 和 基本 关系 ， 


为 不 同学 科 领 域 本 体 的 构建 提供 了 可 扩展 的 顶层 本 体 , 目前 Gene Ontology, Protein Ontology 
以 及 Ontology for Biomedical Investigations 均 采 用 了 BFO 来 支持 相关 研究 领域 中 实体 类 型 体 


系 和 关系 的 构建 中。 


DOLCE 本 体 作为 WonderWeb 项 目 
式 明 确 表示 了 与 本 体 库 中 各 扩展 模块 的 关系 , 以 及 用 了 
结构 。DOLCE 的 持久 性 实体 类 和 临时 性 实体 类 与 BF 


pa 


DOLCE 将 实体 的 特征 值 、 属 性 


E. 时空 范 


基础 本 体 库 中 最 先 开 发 的 模块 , 以 


顶层 本 体 的 形 


通 ) 


围 等 


具体 描述 


DOLCE 本 体 应 用 于 WordNet 概念 的 规范 化 组 织 和 
DOLCE 本 体 通 过 引入 概念 之 


体 规范 概念 化 的 组 


织 框架 ， 


S 
的 


例 化 关系 ， 与 WordNet 的 上 层 概念 ; 
局 面 ; Ah, WordNet 将 时 间 、 空 间 等 对 象 概念 和 属性 


然而 DOLCE 界定 了 对 象 概 念 和 描述 概念 的 范 


的 这 些 概 念 可 在 相应 体系 ! 


组 织 管理 中 。 


通过 对 BFO 类 和 关系 


物质 实体 的 描述 大 体 从 


2.2 领域 应 用 本 体 


领域 应 用 本 体 一 般 面 向 学 科 中 的 
较为 全 面 描述 该 领域 知识 的 本 体 模型 。 本 文选 取材 料 学 和 


学 科 中 的 研究 进展 。 


在 这 两 个 


前 材料 科学 领域 本 体 的 构建 


行 比 较 和 


H, 分 别 为 


本 知识 抽取 、 跨 学 科 


基于 纳米 


vA] 


D, f 


发 现 已 有 本 体 或 词汇 资源 的 深层 知识 
O 类 型 体系 所 表达 的 含义 类 似 ， 同 时 ， 
言 息 在 抽象 类 (Abstract) 体系 中 组 织 。 

描述 , 由 于 WordNet 缺乏 
闻 的 继承 关系 、 个 
WT WordNet 中 概念 和 实例 混淆 


各 现实 知识 和 实 
本 和 概念 之 间 的 


FE、 关系 等 描述 概念 混杂 


分 领域 , 依据 明确 


体系 以 及 DOLCE 在 描述 和 组 织 知识 中 应 | 
回 有 特征 、 
分 别 抽象 为 相应 的 上 层 类 , 并 通过 基本 实体 关系 的 
体系 ， 因 此 该 类 本 体能 够 反映 现实 世界 


为 抽象 概念 ， 


构建 了 相应 的 类 型 体系 , WordNet 


j 的 分 析 ， 项 层 本 体 对 


空间 及 时 间 等 方面 , 将 这 些 能 够 表达 实体 基本 特征 的 信息 
获 ， 为 规范 化 组 织 概念 提供 了 上 层 关 系 
一 般 实 体 的 特征 状态 和 存在 关系 。 


的 领域 需求 和 应 用 目标 , 构建 能 够 


生物 医学 领域 , 分 析 领 域 应 用 本 体 


以 标准 化 的 模式 实现 了 相关 领域 数据 资源 和 材料 
性 的 集成 %。PLINIUS 本 体 提供 了 陶瓷 材料 领域 的 知识 模型 ,基于 该 领域 的 原子 概念 和 提 
规则 构建 较为 复杂 的 概念 ， 形 成 能 够 用 于 陶瓷 材料 领域 文本 知识 抽取 的 知识 
领域 的 标准 和 权威 资源 构建 本 体 , 提供 了 与 


究 描 述 了 材料 科学 的 知识 概念 和 关系 , 在 数据 集成 、 文 
分 类 模式 构建 以 及 数据 库 之 间 的 信 
Fujita 构建 的 本 体面 向 材料 选择 的 过 程 ， 


互 等 方面 得 到 应 用 。Ashino 和 
Es 
EFE 
%4., Tanaka 
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这 些 领域 应 用 本 体 分 别 面 向 材料 科学 的 具体 领域 , 提供 了 梳理 其 应 用 领域 中 知识 及 其 关系 的 


模型 。 


为 了 对 生物 医学 领域 海量 的 数据 和 事实 知识 进行 有 效 的 组 织 管理 和 分 析 利 用 ，OBO 本 
体 库 (Open Biological and Biomedical Ontologies) 通过 构建 一 系列 的 领域 本 体 ， 描 述 各 细 分 
领域 中 的 基础 实体 站。 基因 本 体 (Gene Ontology) 是 其 中 的 典型 案例 ， 通 过 构建 可 共享 和 结 
构 化 术语 模型 的 方式 用 于 标注 有 机 体 分 子 特征 ， 以 分 子 功 能 (molecular function)、 生 物 过 
f£ (biological process). ZH; (cellular component〉 三 个 本 体 分 支 提供 了 描述 有 机 体内 
基因 产物 的 结构 化 词汇 集合 , 着 重 于 表达 基因 产物 特征 和 详情 ,以 及 构建 这 些 生物 学 领域 术 
语 之 间 的 明确 关系 。 基因 本 体 用 于 基因 产物 资源 的 有 效 组 织 及 其 生物 学 特征 的 准确 标注 ， 从 
而 支持 跨 库 资源 的 查询 、 检 索 和 集成 "1。 

虽然 这 些 领域 应 用 本 体 作为 相关 领域 的 知识 模型 , 较为 清晰 地 描述 了 领域 的 核心 概念 和 
知识 关系 ,但 是 这 些 本 体 只 关注 各 自 局 限 的 应 用 领域 ， 即 使 在 同一 学 科 中 ,由 于 缺乏 概念 集 
成 和 相互 关联 的 机 制 ， 领 域 本 体 的 组 织 体系 和 结构 框架 不 一 致 ， 较 难 满 足 本体 可 扩展 性 的 需 
求 ， 阻 得 了 知识 管理 任务 中 本 体 的 语义 标准 化 和 互 操作 。 

2.3 领域 上 层 本 体 

为 了 解决 领域 应 用 本 体 在 可 扩展 和 语义 交互 方面 存在 的 上 述 问 题 , 领域 上 层 本 体 捕 获 了 
于 描述 学 科 领 域 基本 特征 的 核心 类 和 关系 , 作为 面向 该 学 科 所 有 研究 领域 的 普 适 本 体 , 提 
~ 供 规范 化 组 织 和 描述 领域 概念 及 其 关系 的 上 层 框架 。 本 部 分 仍 以 生物 医学 和 材料 学 领域 为 例 ， 
co 分 析 这 两 个 学 科 领 域 上 层 本 体 的 相关 研究 。 

E 为 了 解决 生物 医学 不 同 领域 本 体 的 语义 标准 化 和 互 操作 问题 ，OBO 构建 了 一 个 通用 的 
© 领域 上 层 本 体 ， 用 于 实现 生物 医学 领域 本 体 的 集成 和 标准 化 。 一 方面 根据 Gene Ontology, 
Cell Ontology, ChEBI (Chemical Entities of Biological Interest)， 分 析 得 到 能 够 体现 生物 医学 
领域 共有 特征 的 上 层 类 和 关系 上 ;， 另 一 方面 扩展 和 再 设计 原 有 的 GENIA 框架 ， 解决 了 
GENIA 类 型 撕 述 或 组 织 结构 存在 的 缺乏 标准 化 的 问题 , 构建 BioTop (Biological Top-Level) 
本 体 作为 集成 各 生物 医学 领域 本 体 的 框架 0。 为 了 涵盖 生物 化 学 领域 的 概念 ，BioTop 中 的 
部 分 类 迁移 至 新 建 本 体 ChemTop，BioTop 包含 了 对 分 子 生物 和 生物 医学 领域 基本 类 型 的 
述 ，ChemTop 则 展现 了 生物 化 学 领域 的 关键 概念 类 型 ， 二 者 共同 作为 领域 上 层 本 体 ， 能 够 
较为 全 面 地 定义 和 描述 生物 医学 领域 中 的 基本 实体 和 关系 。 图 1 表达 了 BioTop 和 ChemTop 
作为 领域 描述 的 中 间 层 ,与 顶层 本 体 和 领域 应 用 本 体 的 无 颖 衔接 。BioTop 和 ChemTop 类 的 
e 构建 基于 顶层 本 体 BFO，BioTop 继承 了 BFO 的 Material Entity 并 按照 实体 粒度 扩展 子 类 体 
系 ， 关 系 的 表达 则 来 源 于 顶层 关系 本 体 RO (Relation Ontology) 的 关系 类 型 站。 对 于 具体 应 
© 用 领域 的 本 体 ，Gene Ontology, Cell Ontology 与 BioTop， 以 及 ChEBI 与 ChemTop 分 别 通 
过 类 的 匹配 和 映射 ， 实 现 了 不 同 OBO 领域 应 用 本 体 的 集成 。BioTop 和 ChemTop 为 不 同 来 
源 的 生物 医学 领域 本 体 提 供 了 标准 化 和 体系 化 的 语义 集成 框架 , 其 定义 的 概念 类 型 成 为 关联 
OBO 领域 本 体 的 桥梁 ， 能 够 增强 信息 抽取 和 文本 挖掘 等 自然 语言 处 理应 用 的 效果 。 
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Domain 
Ontology 


1 BioTop 和 ChemTop 作为 领域 上 层 本 体 的 模型 图 中 
在 材料 科学 领域 本 体 的 研究 中 ，MatOnto 本 体 通 过 构建 材料 科学 领域 的 通用 、 可 扩展 模 
型 ， 促 进 材料 科学 各 领域 数据 资源 和 实验 过 程 的 交互 、 重 用 和 集成 。MatOnto 本 体 的 建设 目 


标 在 于 构建 材料 学 领域 上 层 概念 类 型 的 组 织 框架 , 所 遵循 的 原则 首先 基于 顶层 本 体 构建 , H. 
其 知识 组 织 框架 能 够 提供 丰富 、 易 于 理解 的 抽象 概念 类 型 以 及 清晰 的 组 织 结构 ; 另外 依据 已 
有 的 领域 本 体 或 权威 词汇 表 , 尽 可 能 保证 本 体 的 概念 体系 符合 领域 大 多 研究 人 员 的 认 知 需求 。 
MatOnto 本 体 以 顶层 本 体 DOLCE 作为 上 层 基础 框架 ， 从 DOLCE 的 三 个 大 类 Endurants、 
Perdurants、Abstract 出 发 ， 以 扩展 其 子 类 的 方式 构建 类 体系 。MatOnto 复 用 了 Ontolingua 本 
体 的 标准 单位 类 、W3C 的 时 间 本 体 、 语 义 网 研究 社 群 本 体 (SWRC) 等 本 体 或 分 类 表 ， 通 
过 扩展 EXPO 本 体 的 事件 和 过 程 概念 来 丰富 科学 实验 的 描述 ,在 扩展 材料 学 领域 概念 方面 ， 
通过 引入 本 体 或 词汇 表 扩 展 了 MatOnto 上 层 类 ,例如 ,与 学 科 分 类 词 表 JACS Joint Academic 
Classification of Subjects〉 中 材料 学 科 的 关联 实现 对 材料 学 概念 体系 的 表达 ， 从 特征 、 分 类 
体系 、 生 产 测量 过 程 、 材 料 结构 和 关联 数据 等 方面 实现 了 对 材料 学 领域 核心 概念 的 全 面 表达 
(31; MatOnto 作为 材料 领域 的 上 层 本 体 , 提供 了 组 织 管理 材料 学 核心 知识 以 及 集成 相关 领域 
本 体 的 基础 框架 , 基于 本 体 模型 中 通用 的 材料 领域 术语 集合 , 实现 了 异 构 和 不 同 数据 源 的 数 
据 发 现 、 检 索 、 集 成 。 

领域 上 层 本 体 BioTop、 ChemTop 和 MatOnto 作为 领域 本 体 框架 的 中 间 层 ， 从 BFO 等 
描述 现实 世界 普 适 概念 的 顶层 本 体 扩展 而 来 , 捕获 了 具有 学 科 领 域 特征 的 上 层 类 和 关系 , K 
现 了 领域 普 适 顶层 本 体 和 领域 应 用 本 体 之 间 类 和 关系 的 衔接 , 能 够 促进 学 科 中 其 他 领域 本 体 
的 集成 以 及 新 细 分 领域 本 体 的 构建 。 

通过 分 析 以 上 本 体 模 型 的 类 型 体系 、 关 系 框架 、 建 模 过 程 、 构 建 方法 、 应 用 实践 ， 并 根 
据 STKOS 的 需求 和 目标 ， 这 些 不 同 层 次 领域 本 体能 够 为 STKOS 本 体 建设 提供 以 下 参考 : 

(1) STKOS 面向 多 学 科 建 立领 域 本 体 网 络 和 动态 建 模 的 本 体 工 具 集 ， 因 此 ， 需 要 统一 
的 框架 体系 对 各 领域 进行 概念 的 规范 整合 和 关系 的 清晰 梳理 。 顶层 本 体 描述 了 各 学 科 领 域 普 
适 的 基本 实体 概念 和 知识 关系 , 作为 上 层 框架 能 够 通过 类 和 关系 的 扩展 , 将 各 学 科 领 域 的 知 
识 及 其 关系 纳入 规范 化 的 组 织 结构 中 。 
(2) 由 于 学 科 涉 及 众多 细 分 领域 ，STKOS 领域 本 体 网 络 实现 本 体重 用 、 映 射 和 关联 的 

目标 , 要 求 所 构建 领域 本 体 具有 可 扩展 性 且 彼 此 能 够 语义 交互 。 领域 上 层 本 体 作 为 某 一 学 科 
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领域 的 上 层 基础 框架 ， 规 范 一 致 的 扩展 结构 促进 了 本 体 的 集成 、 复 用 和 互 操作 ， 可 用 于 新 细 
分 领域 的 本 体 构 建 或 已 有 本 体 结 构 的 优化 , 而 且 对 体现 学 科 领 域 共有 特征 核心 概念 和 知识 关 
系 较为 全 面 的 捕获 也 能 够 保证 学 科 的 知识 需求 。 

(3) STKOS 目标 通过 本 体 工具 集 的 建立 实现 领域 本 体 的 动态 建 模 , 需要 明确 的 本 体 构 
建 场景 和 流程 框架 。 在 领域 上 层 本 体 的 构建 过 程 中 ,继承 顶层 本 体 的 类 和 关系 体系 、 集 成 和 
复 用 已 有 领域 本 体 或 权威 词汇 表 等 活动 , 为 开发 支持 本 体 工程 情境 化 的 工具 提供 了 规范 的 场 
景 依据 。 此外， 领域 应 用 本 体 可 基于 顶层 本 体 和 领域 上 层 本 体 的 模型 框架 , 通过 从 抽象 到 具 
体 的 类 和 关系 扩展 ， 实 现 动态 和 快速 建 模 。 

3 STKOS 领域 本 体 框架 及 其 构建 方法 

本 文 构建 了 面向 STKOS 本 体 建 设 的 学 科 领 域 本 体 模型 框架 ， 由 顶层 本 体 、 领 域 上 层 本 
体 、 领 域 应 用 本 体 组 成 的 建立 领域 本 体 的 三 层 架 构 ， 如 图 2 所 示 ， 并 提出 领域 本 体 在 构建 中 
可 依据 的 过 程 和 方法 ， 以 期 为 STKOS 各 应 用 领域 构建 本 体 和 本 体 工具 集 开 发 所 基于 的 情境 
化 流程 提供 参考 。 


顶层 本 体 


特征 、 空 间 、 时 间 等 基 — 参考 BF0、DOLCE、 关 系 ” 适 于 广泛 领域 进行 概念 
本 实体 及 其 关系 体系 本 体 RO 等 扩展 和 知识 组 织 


领域 上 层 本 体 


基于 STK0S 超 — 词 表 转 为 本 本体 作 为 补  ” 概念 规范 和 — 体现 学 科 共 
级 科技 词 表 。” 体 映射 规则 充 资 源 本 体重 用 有 特征 


领域 应 用 本 体 
根据 应 用 需求 和 建设 目标 较为 全 面 地 描述 该 领域 中 的 关键 知识 


| 


图 2 STKOS 领域 本 体 模型 框架 和 构建 方法 体系 

da) ”顶层 本 体 

上 层 框 架 中 的 实体 不 具有 学 科 特 征 ,一般 从 特征 、 空 间 、 时 间 等 方面 对 现实 世界 中 物质 
进行 描述 。 不 同学 科 可 根据 其 领域 中 实体 的 特征 ， 选 择 BFO、DOLCE 等 认可 度 较 高 的 顶层 
本 体 作 为 学 科 概 念 类 型 扩展 的 基础 框架 , 上 层 关 系 框架 可 参考 顶层 关系 本 体 RO 的 基本 关系 。 
顶层 本 体 要 具有 适 于 广泛 领域 进行 概念 扩展 和 知识 组 织 的 基本 实体 及 其 关系 体系 , 能 够 为 学 
科 领 域 概念 的 定义 和 组 织 提 供 普 适 框架 。 

QD ”领域 上 层 本 体 

作为 连接 顶层 本 体 和 具体 领域 应 用 本 体 的 中 间 框 架 , 领域 上 层 本 体面 向 某 一 学 科 由 顶层 
本 体 扩展 而 来 ， 为 学 科 各 应 用 领域 的 本 体 构建 或 集成 提供 可 扩展 的 模型 。 由 于 STKOS 的 超 
级 科技 词 表 对 于 一 些 学 科 领 域 规范 整理 了 科技 概念 以 及 继承 梳理 了 关系 属性 趾 , 因此 一 方面 
基于 超级 科技 词 表 ， 制 定 词 表 向 本 体 转 化 的 映射 规则 ;， 另 一 方面 调研 分 析 领 域 中 成 熟 本 体 、 
权威 词汇 表 以 及 新 建 知识 组 织 体系 作为 补充 资源 ,通过 词 表 概 念 的 北 选 、 规 范 和 本 体 的 重用 、 
重 构 、 上 映射 ， 以 及 继承 词 表 或 已 有 本 体 的 关系 属性 ， 形 成 能 够 体现 学 科 共 有 特征 的 核心 概念 
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及 其 关系 体系 ， 从 而 构建 适 于 该 学 科 组 织 和 描述 知识 的 上 层 本 体 。 

(3) ”领域 应 用 本 体 

以 上 两 层 结构 为 底层 领域 应 用 本 体 的 构建 提供 了 扩展 依据 和 基础 框架 , 根据 领域 应 用 需 
求 和 具体 建设 目标 ,分 析 从 哪些 方面 能 够 较为 全 面 地 描述 该 领域 中 的 关键 知识 ， 从 而 明确 如 
何 扩展 领域 上 层 本 体 ， 形 成 描述 该 具体 应 用 领域 中 资源 的 知识 模型 。 
4 植物 多 样 性 领域 本 体 构 建 示例 

本 文 以 植物 多 样 性 领域 为 例 , 针对 中 国 科学 院 植物 研究 所 有 效 组 织 植物 多 样 性 领域 重点 
关注 的 物种 信息 的 需求 ， 包括 物种 的 名 称 、 分 类 位 置 、 形 态 描述 以 及 分 布地 信息 。 本 文 按照 
提出 的 三 层 框架 以 及 建设 方法 体系 , 示例 植物 多 样 性 领域 本 体 的 构建 过 程 , 图 3 展示 了 植物 
多 样 性 领域 本 体 的 知识 组 织 体系 ， 虚 线 方 杠 、 椭 圆 框 、 实 线 方 框 分 别 代表 了 顶层 本 体 、 生 物 
多 样 性 领域 上 层 本 体 、 底 层 植物 多 样 性 领域 扩展 本 体 的 类 ， 捕 获 了 各 层级 的 核心 知识 关系 ， 
展示 了 不 同 层级 架构 之 间 的 扩展 体系 , 实现 植物 多 样 性 领域 核心 概念 的 组 织 和 关键 信息 源 的 
曹 述 。 限 于 篇 幅 ， 图 3 只 展示 了 多 样 性 领域 的 部 分 类 。 
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图 3 植物 多 样 性 领域 本 体 三 层 框架 结构 


4.1 顶层 本 体 框架 
由 于 BFO 本 体 在 OBO 本 体 库 建设 中 的 成 功 应 用 ， 显 示 了 其 能 够 较 好 地 适用 于 生物 学 
不 同 领 域 本 体 的 构建 站， 因此 ， 本 研究 通过 复 用 BFO 本 体 构 建 顶 层 本 体 的 类 和 关系 。 顶 层 
本 体 需要 为 学 科 领 域 提供 普 适 框架 , 其 类 和 关系 应 能 够 表示 学 科 领 域 中 实体 的 一 般 状 态 , 按 
HE BFO 本 体 的 “物质 (Material) -特征 (Quality)” 模 型 框架 ,同时 考虑 时 空 、 过 程 等 因素 ， 
构建 生物 学 领域 表达 核心 概念 的 顶层 知识 组 织 体系 。 
4.2 生物 多 样 性 领域 上 层 本 体 框架 
本 研究 的 中 层 框架 面向 生物 多 样 性 领域 ， 由 顶层 本 体 的 类 和 关系 扩展 而 来 ， 首 先 梳理 、 
H, TREH T STKOS 关于 生物 多 样 性 、 环 境 物 质 等 领域 词 表 的 核心 概念 ， 依 据 词 表 向 
本 体 转 化 的 映射 规则 ， 并 参考 复 用 Darwin Core04、 表 型 和 特征 本 体 (Phenotype And Trait 
Ontology, PATO) “小 、 环 境 本 体 (Environment Ontology, ENVO) 09 等 领域 本 体 或 词 表 ， 从 
描述 物种 、 生 态 系 统 、 遗 传 的 多 样 性 方面 ,构建 描述 生物 多 样 性 核心 概念 及 其 关系 的 领域 上 


层 框 架 。 
COD 描述 物种 多 样 性 的 知识 组 织 体系 

生物 多 样 性 领域 的 组 织 框 架 以 物种 (species) 为 分 界线 和 核心 ， 类 体系 捕获 了 物种 的 分 
类 术语 、 形 态 特征 及 其 所 处 的 生境 、 栖 息 地 、 保 护 区 、 行 政 区 域 和 环境 条 件 ， 建 立 了 分 类 概 
念 之 间 、 物 种 与 特征 、 物 种 与 地 域 、 物 种 与 环境 实体 的 知识 关系 ， 从 而 能 够 揭示 物种 的 分 类 
位 置 、 物 种 的 基本 特征 、 地 域 的 物种 清单 、 物 种 依赖 的 环境 物质 等 信息 。 

有 关 生 物 有 机 体 名 称 和 分 类 的 术语 概念 界定 ， 通 过 复 用 Darwin Core 的 相关 元 素描 述 了 
门 、 纲 、 目 、 科 、 属 、 种 的 概念 "， 并 建立 了 相 邻 分 类 位 置 概念 之 间 的 互 逆 关 系 ， 用 于 描 
述 物种 所 在 的 分 类 位 置信 息 。 针 对 生物 个 体 及 其 组 成 器 官 的 特征 , 依据 PATO 本 体 扩展 了 形 
态 特征 (morphology)、 有 机 体 特征 〈organismal quality) 等 类 ， 提 供 了 物种 通用 物质 特征 的 
上 层 框架 。 生 物 多 样 性 有 关 地 域 信 息 的 表达 ， 包 括 物种 所 处 〈located in). 的 气候 区 Climate 
region)、 出 现 Coccurs in) 的 保护 区 Cconservation area). 栖息 Chabitated in) 的 生境 (habitat) 
以 及 分 布 (distributed in) 的 行政 区 域 Cpolitical region)， 从 而 可 获得 对 物种 地 域 信息 的 全 方 
位 描述 ， 以 及 梳理 某 一 地 域 中 的 物种 清单 。 此 外 ,构建 了 表达 环境 物质 的 类 体系 ,包括 大 气 

(air)、 土 壤 CsoiD 等 物种 生存 所 依赖 (under condition〉 的 环境 因素 。 
QD 描述 生态 系统 多 样 性 的 知识 组 织 体系 

此 部 分 表达 了 可 度量 种 群 、 生 态 系统 层级 的 多 样 性 ,不仅 揭 示 了 物种 与 种 群 、 生 态 系统 
的 部 分 整体 关系 (part of)， 而 且 构建 了 丰富 的 指标 类 , 用 于 定量 化 表征 生态 系统 的 多 样 性 ， 
以 及 反映 了 地 域 环境 的 复杂 性 对 生物 多 样 性 的 影响 。 

生态 系统 (biome) 下 包含 水 生 群 系 (aquatic biome) 和 陆 生 群 系 (terrestrial biome) 及 
其 下 属 的 各 个 群 系 类 型 , 例如 水 生 群 系 下 又 划分 为 淡水 生态 系统 和 海洋 生态 系统 。 本体 构 建 
了 定量 表征 生物 多 样 性 的 指标 类 体系 (biodiversity index )， 这 些 主要 用 于 描述 和 衡量 生态 系 
统 多 样 性 大 小 和 格局 的 具体 指数 , 包括 描述 物种 和 遗传 的 不 同 层级 的 多 样 性 指标 , 例如 常用 
的 Shannon-Wiener 指 数 ,也 包括 一 些 最 近 兴 起 的 表征 功能 多 样 性 和 系统 发 育 多 样 性 的 指标 。 
35. 以 上 对 于 物种 相关 地 域 环境 的 描述 ,同样 适用 于 建立 生态 系统 类 与 上 述 地 域 环境 类 的 
关系 ， 表 达 某 一 生态 系统 所 处 的 地 域 信息 以 及 所 需 的 环境 条 件 。 

(3) 描述 遗传 多 样 性 的 知识 组 织 体系 

为 了 描述 物种 的 遗传 多 样 性 ， 本 体 建 立 了 物种 与 基因 序列 (sequence) 的 关联 ， 用 于 描 
述 物种 使 用 的 基因 组 片段 , 并 且 通 过 为 物种 赋予 数值 属性 (sequence data), 提供 物种 在 NCBI 
上 的 物种 IDP， 可 以 进行 关联 和 检索 DNA. 条 码 测 序数 据 。 

4.3 植物 多 样 性 领域 的 本 体 扩展 

由 于 植物 多 样 性 是 生物 多 样 性 研究 的 细 分 领域 , 因此 通过 为 生物 多 样 性 领域 上 层 本 体 扩 
展 子 类 体系 的 方式 ， 能 够 基本 满足 植物 多 样 性 描述 的 需求 。 由 生物 多 样 性 领域 上 层 框 架 ， 同 
样 地 将 送 选 的 STKOS 植物 领域 词 表 概念 进行 转化 ,还 主要 复 用 了 PO 本 体 (Plant Ontology) 
0 的 类 和 关系 ， 从 植物 的 组 成 结构 、 生 长 发 育 、 个 体 及 其 组 成 部 分 的 特征 、 生 活 型 信息 等 
方面 ， 扩 展 了 本 体 中 面向 植物 多 样 性 领域 的 概念 和 关系 。 

本 体 构建 了 叶 、 花 、 果 实 等 植物 组 成 结构 类 , 并 捕获 了 这 些 类 之 间 的 发 育 关 系 (develops 
from)， 从 形状 (shape)、 结 构 Cstructure), Mif (color)、 表 面 (surface) 等 方面 ， 扩 展 了 
植物 个 体 和 结构 层面 的 特征 (小 ， 同 时 也 重点 捕获 了 植物 生长 发 育 过 程 涉及 的 细胞 、 组 织 等 
微观 概念 ， 从 而 揭示 了 处 于 某 个 生长 过 程 或 发 育 阶段 的 某 一 物种 及 其 组 成 结构 的 特征 。 如 图 
3 Wrzs, HESS Cgynoecium) 是 花 (flower) 的 组 成 结构 ， 果 实 Crui HERRAR: 花 
在 (participates in) 发 育 阶段 (flower development stage) F, 由 花 分 生 组 织 (flower meristem) 
发 育 而 来 , 这 些 分 生 组 织 由 分 生 细 胞 (meristematic cell? 组 成 。 此 外 , 生活 型 信息 Aife form? 
类 体系 用 于 表达 植物 丰富 的 生活 特征 ， 例 如 ， 根 据 植物 的 寿命 〈longevity)， 生 活 型 包括 一 


年 生 、 二 年 生 、 多 年 生 。 
同时 ， 对 于 植物 个 体 或 组 成 的 部 分 形态 特征 ， 可 采用 添加 数值 属性 的 方式 描述 ， 例 如 叶 
片 的 长 度 (length)、 宽 度 (width〉 等 特征 。 男 外 ， 丰 富 了 本 体 中 物种 、 地 域 、 分 类 、 形 态 
等 类 在 植物 多 样 性 领域 的 实例 , 并 补充 了 植物 物种 的 同义词 ( 含 同 物 异 名 、 缩 写 词 .英文 名 )。 
4.4 本 体 的 效果 评价 

本 文 按照 领域 本 体 模型 三 层 架 构 所 构建 的 植物 多 样 性 领域 本 体 , 较 之 其 他 领域 本 体 , A 
有 如 下 优点 : 

(1) 清晰 的 知识 组 织 体 系 

由 本 文 模型 框架 形成 的 此 领域 本 体 具 有 逐 层 深入 的 组 织 体系 , 依据 各 层级 的 知识 组 织 特 
征 和 构建 流程 ， 顶 层 本 体 具 有 适 于 生物 学 知识 组 织 的 MQ 模型 框架 ， 领 域 上 层 本 体 满 足 了 
E 物 多 样 性 领域 知识 从 物种 多 样 性 、 生 态 系统 多 样 性 、 遗 传 多 样 性 方面 进行 表征 的 需求 ， 底 
层 本 体 在 此 框架 的 基础 上 针对 植物 领域 深入 扩展 。 因此 , 该 本 体 的 类 及 其 关系 体系 较为 清晰 
地 反映 了 植物 多 样 性 领域 的 知识 脉络 。 

(20 更 为 高 效 的 构建 过 程 

本 文 提出 的 模型 框架 ， 为 领域 本 体 的 构建 提供 了 可 扩展 的 组 织 架构 和 规范 的 建设 场景 ， 
~ 对 于 构建 流程 和 方法 的 梳理 也 促进 了 领域 本 体 建设 效率 的 提高 。 领 域 上 层 框架 明确 了 
STKOS 词 表 向 本 体 转化 的 规则 ， 以 及 生物 多 样 性 领域 的 知识 表达 需求 ， 为 细 分 领域 本 体 的 
建设 提供 了 快速 扩展 的 依据 。 

G) 支撑 更 加 丰富 的 应 用 场景 

该 领域 本 体 对 植物 多 样 性 领域 中 核心 概念 和 知识 关系 的 全 方位 捕获 , 能 够 支持 丰富 的 应 
场景 。 一 方面 实现 知识 的 多 维度 语义 标注 ， 通 过 标 引 地 区 的 物种 、 生 态 系 统 类 型 及 其 多 样 
性 指数 的 数值 ， 可 实现 该 地 区 多 样 性 的 表征 ; 再 比如 ， 某 一 地 区 或 生态 系统 的 环境 条 件 及 其 
与 生物 多 样 性 的 关系 ， 可 通过 标 引 地 区 、 生 态 系统 类 型 、 环 境 条 件 和 生物 多 样 性 指数 等 实现 
该 类 问题 的 回答 。 另 一 方面 促进 领域 数据 的 组 织 和 知识 的 揭示 , 可 依据 植物 多 样 性 领域 本 体 
中 的 植物 分 类 ， 将 物种 进行 属 、 种 等 层次 的 组 织 ， 以 及 可 梳理 某 一 地 区 (如 自然 保护 区 ) 包 
含 的 物种 数目 、 清 单 ， 在 揭示 领域 知识 方面 ， 利 用 植物 多 样 性 领域 本 体 中 的 植物 分 布地 域 、 
生境 类 型 、 生 物 多 样 性 指标 、 形 态 特征 、 生 长 发 育 期 等 类 和 实例 标注 来 源 数据 ， 能 够 识别 与 
e 汇集 有 关 植 物 分 布 、 生 境 、 多 样 性 指标 、 形 态 、 生 长 发 育 阶段 对 应 的 数据 ， 通 过 揭示 这 些 领 
= 域 知识 ， 可 用 于 描述 植物 在 不 同 尺度 下 生长 发 育 和 形态 可 塑性 的 趋 异 性 。 
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© 根据 以 上 效果 分 析 , 此 本 体 基 本 涵盖 了 植物 多 样 性 领域 的 核心 概念 , 能 够 满足 植物 所 组 


织 和 揭示 该 领域 重点 关注 信息 的 需求 。 由 于 词 表 的 结构 各 异 ,， 可 参考 复 用 的 领域 本 体面 向 不 
同 的 建设 需求 ， 因 此 ， 虽 然 本 文 提 出 了 领域 本 体 的 普 适 框架 ， 但 是 在 应 用 过 程 中 ， 也 会 遇 到 
难以 用 统一 的 映射 规则 对 词 表 概念 进行 转化 , 以 及 不 同 来 源 概念 如 何 准确 归 类 的 问题 另外 ， 
E 物 多 样 性 领域 框架 限定 了 植物 多 样 性 领域 概念 的 扩展 来 源 , 底层 本 体 只 能 由 己 有 的 上 层 类 
来 添加 子 类 体系 ， 因此 ,对 于 从 多 个 来 源 词 表 北 选 的 植物 多 样 性 领域 概念 ,会 存在 少数 概念 
较 难 找到 合适 上 层 类 的 情况 。 

5 结语 

目前 领域 本 体 建设 工作 在 实践 中 常 遇 到 诸多 困难 , 尤其 在 针对 具体 学 科 领 域 各 异 的 应 用 
需求 时 。STKOS 项 目 为 解决 这 个 问题 提供 了 契机 ， 面 向 以 本 体 支持 知识 服务 的 需求 ， 研 究 
建立 领域 本 体 模 型 ， 利 用 项 目 建设 的 大 量词 表 和 概念 网 络 ， 面 向 特定 学 科 领 域 和 应 用 场景 ， 
快速 而 有 效 地 完成 领域 本 体 的 构建 , 正如 在 植物 多 样 性 领域 本 体 建设 中 的 工作 。 未 来 基于 该 
领域 本 体 在 植物 多 样 性 领域 知识 服务 平台 语义 层 的 应 用 ， 将 实现 知识 导航 、 语 义 内 容 关 联 、 
自动 聚 类 等 功能 ， 为 用 户 提供 语义 层次 、 一 体 化 植物 多 样 性 信息 资源 服务 ， 其 可 行 性 将 基于 
STKOS 中 领域 本 体 建设 和 应 用 进一步 完善 。 
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Research on Model for Domain Ontology of STKOS 

Ma Yumeng! Liu Fenghong? Huang Jinxia! 
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Abstract: [Purpose/Significance] This study aims to build a general model for domain ontology 
and normative method system, in order to provide STKOS with structure basis for the dynamic 
modeling of ontology toolkit and the network construction of domain ontology. [Method/Process] 
Based on the research of domain ontology of different levels from which practical conclusions for 
STKOS are summarized, the paper builds model of three-tier architecture for domain ontology and 
puts forward to methods that construction of each tier can follow. Finally, taking the institute of 
botany for example, the paper elaborates the application of this model in the construction of 
domain ontology of plant diversity. [Result/Conclusion] Compared with other domain ontology, 
the domain ontology of plant diversity according to three-tier architecture has a series of 
outstanding features, such as clear knowledge organization system, efficient build process and 
support for rich usage scenario. Therefore, this study provides STKOS with a practical framework 
for quickly constructing effective domain ontology, which can be applied to knowledge service 
platform for the construction of the semantic layer. 
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